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摘要 : 【 目的 】 从 大 量 在 线 商 品评 论 中 筛选 出 可 信 的 评论 辅助 消费 者 制定 购买 决策 。[ 方法 】 提 出 一 种 基于 大 数 
据 思维 的 主流 特征 观点 对 的 概念 , 依据 特征 观点 对 在 不 同 用 户 评论 中 的 认可 程度 ,建立 评论 可 信 性 排序 模型 。 
【 结果 】 淘 宝 、 天 猫 和 京东 平台 的 商品 评论 的 主流 特征 观点 对 是 稳定 的 ; 与 已 有 模型 相 比 , 使 用 本 文 模型 排序 过 
的 用 户 评论 包含 的 产品 特征 范围 更 广 , 评论 有 用 性 提升 7.5%， 更 能 够 反映 评论 的 真实 情况 。[ 局 限 】 仅 从 评论 包 
含 的 特征 观点 对 考虑 评论 可 信 性 ， 而 未 考虑 评论 的 具体 语义 情况 。【 结论 】 包含 主流 特征 观点 对 数量 越 多 的 评论 ， 


其 可 信和 度 则 越 大 。 
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特征 观点 对 ”可 信和 度 


1 3 引 


随 着 网 络 购物 的 发 展 ,购物 网 站 上 有 关 商 品 的 
在 线 评论 数量 急速 增长 。 研 究 发 现 ,91% 的 消费 者 在 
做 出 购买 决策 之 前 查询 并 阅读 在 线 论坛 .博客 等 相关 
评论 "。 如何 从 大 量 在 线 评论 中 快速 筛选 出 真实 可 信 
的 评论 以 帮助 消费 者 制定 购买 决策 显得 十 分 重要 。 

影响 评论 可 信 度 的 因素 很 多 ,一 般 从 信 源 的 可 信 
度 、 评 论 者 本 身 可 信和 度 和 评论 内 容 的 可 信 度 三 个 方面 
研究 。 本 质 上 说 ,可 信 度 高 的 评论 因 其 本 身 包含 的 用 
户 评价 信息 的 可 信 度 高 , 往往 会 被 更 多 的 人 提 及 。 这 
与 目前 多 数 搜索 引擎 的 原理 是 一 致 的 ， 搜 索引 擎 对 
查询 页 面 的 排序 是 基于 以 往 用 户 查 询 相同 内 容 时 点 
击 页 面 的 数量 ， 即 那些 被 点 击 次 数 越 多 的 页 面 排序 
越 靠 前 WI， 内 容 也 就 越 可 和信。 在 商品 评论 中 , 用 户 给 
出 的 观点 往往 是 针对 商品 的 不 同 特征 ,商品 特征 及 其 
评价 观点 便 构 成 了 用 户 对 商品 的 基本 评价 单元 , 被 称 


了 中 


作 “ 特 征 观点 对 ”说 。 显 然 , “特征 观点 对 ”作为 一 个 整体 ， 
从 语义 角度 比 单独 分 别 抽取 商品 特征 与 观点 能 够 获取 
更 为 完整 的 用 户 对 商品 的 评论 信息 。 

从 商品 的 特征 观点 对 出 发 ， 本文 基 于 大 数据 思 
维 649 提 出 一 种 主流 特征 观点 对 的 概念 , 讨论 了 评论 
可 信 性 及 大 数据 思维 , 依据 特征 观点 对 在 不 同 用 户 评 
论 中 的 认可 程度 , 包含 某 个 特征 观点 对 的 评论 数量 大 
于 某 个 净值 则 设 定 该 特征 观点 对 为 主流 特征 观点 对 ; 
给 出 在 线 商 品评 论 可 信 度 模型 ， 提取 基于 句法 依存 关 
系 的 特征 观点 对 , 根据 评论 中 所 包含 的 主流 特征 观点 
对 的 数量 对 在 线 评论 的 可 信和 度 进 行 计算 排序 ; 基于 淘 
宝 、 天 猫 和 京东 三 个 电 商 平台 的 评论 , 验证 主流 特征 
观点 对 的 稳定 性 ,同时 , 证 明了 该 方法 对 淘宝 平台 上 
的 用 户 评论 可 信 性 排序 是 有 效 的 。 


2 相关 研究 
目前 ， 有 关 在 线 评论 的 研究 较 多 ,主要 集中 在 商 
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究 一 般 项 目 “C2C 市 场 中 基于 参与 者 行为 的 “ 打 榜 "识别 模型 与 应 
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] 研 究 ”( 项 目 编号 : 13YJA630098) 的 研究 成 果 之 一 。 


品 特征 提取 和 情感 分 析 等 方面 有关 评 论 可 信 性 的 研 
究 包括 评论 可 信 度 影响 因素 、 评 论 可 信和 度 排序 和 评论 
质量 的 研究 。 

(1) 评论 可 信和 度 影 响 因 素 研 究 

影响 评论 可 信 的 因素 较 多 ,如 评论 字数 、 评 论 时 
间 、 评 论 者 排名 和 人 负面 评论 比例 等 "4。 对 于 影响 评论 
可 信和 度 的 因素 , 国内 外 学 者 从 不 同 的 角度 分 别 进行 研 
究 。 郭 国庆 等 ("将 替 夫 兰 德 传播 说 服 模型 引入 在 线 评 
论 可 信 度 研究 并 从 信 源 、 信 息 内 容 和 接收 者 角度 构建 
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园 等 上 从 文本 信息 特征 和 语义 情感 特征 出 发 ， 通 过 相 
关 算法 验证 这 两 类 特征 在 评论 质量 检测 中 的 应 用 效 
果 。 上 有 具有 效用 的 评论 应 该 是 既 能 提供 商品 信息 ,又 能 
展现 出 评论 者 的 观点 。 麦 齐 将 与 主客 观 特 质 相 
关 的 特征 指标 (评论 的 主观 度 均 值 和 评论 的 主观 度 方 
差 ) 引 入 到 评论 质量 的 评价 中 。 

综 上 所 述 ， 现 有 的 大 多 文献 对 评论 可 信和 性 研究 多 
是 从 一 些 外 在 的 因素 出 发 ， 如 评论 可 信 度 影响 因素 ( 评 
论 时 间 、 评 论 者 的 排名 情况 等 ) 即使 从 评论 的 文本 特 


在 线 评论 可 信和 度 影响 因素 模型 。 孟 美 任 等 中 "通过 问卷 
调查 的 方式 获得 影响 评论 可 信 度 的 4 类 特征 一 一 内 容 
完整 性 、 情 感 平衡 性 、 评 论 时 效 性 以 及 发 布 者 身份 明 
确 性 , 在 此 基础 上 结合 CRFs 模型 对 评论 可 信 度 进行 
分 类 ,最终 得 出 最 佳 的 特征 组 合 以 改善 “人 工效 用 评 
价 ”方式 ,通过 对 大 学 生 消 费 群体 进行 评论 信息 可 信 度 
影响 因素 的 实证 分 析 ， 获 思 兰 等 5 发 现 评 论 中 商品 描 
述 信息 的 详细 度 、 情 感 倾 向 的 客观 性 、 发 布 者 身份 的 
明确 性 、 信 息 发 布 的 及 时 性 等 都 对 评论 信息 的 可 信 度 
产生 正面 影响 。 

(2) 评论 可 信 度 排序 

当前 学 术 界 对 可 信和 度 排序 的 研究 相对 较 少 。 从 特 
征 的 角度 出 发 , 刘 透 筷 等 "提出 基于 文本 挖掘 的 评论 
可 信 度 测评 模型 ， 提 取出 内 容 特 征 词 和 结构 特征 词 ， 
并 结合 领域 本 体 对 特征 词 可 信和 度 进行 测量 。 基 于 用 户 评 
论 内 容 和 商品 特征 之 间 的 关联 度 ， 黄 婷 婷 等 呈 提 出 一 
种 评论 可 信 度 排序 方法 。 王 倩 倩 咏 将 文本 型 评论 和 数值 
型 评论 的 不 一 致 性 和 影响 评论 可 信 的 其 他 因素 结合 ， 
提出 一 种 评论 信息 可 信和 度 排 序 方法 。 都 玫 等 29 构建 评论 
可 信和 度 指标 体系 , 借助 Visual Studio 程序 开发 平台 对 
指标 进行 预 调 整 和 数值 优化 ,进而 采用 问卷 调查 法 获 
取 指 标 打 分 ， 结 合 模糊 层次 分 析 法 构建 可 信 度 排序 模 
型 。 上 述 对 评论 可 信和 性 排序 的 研究 是 基于 评论 的 结构 和 
内 容 本 身 进行 的 , 一 方面 就 语义 角度 来 说 , 信息 粒度 较 
小 ; 另 一 方面 , 没有 从 整体 上 反映 用 户 的 推荐 意见 。 

(3) 评论 质量 研究 


的 特征 可 以 分 为 两 大 类 : 元 数据 特征 和 文本 特征 。 
数据 特征 主要 包括 评论 评分 、 评 论 有 用 票数 、 评 论 发 
表 时 间 等 ; 文本 特征 包括 语法 、 语 义 和 文 体 特征 。 备 


征 出 发 , 也 多 是 研究 其 包含 的 语法 特征 、 以 及 较 小 语 
义 粒度 的 商品 特征 。 基 于 大 数据 思维 ,本 文 将 具有 和 较 
大 语义 粒度 的 商品 特征 观点 对 作为 评论 可 信 的 文本 特 
征 以 及 特征 观点 对 在 多 数 用 户 评 论 中 得 到 认可 (主流 
特征 观点 对 ) 作 为 依据 ， 提出 一 种 评论 可 信和 度 排序 方 
法 , 在 线 商 品评 论 中 包含 的 主流 特征 观点 对 数目 越 多 ， 
该 评论 的 可 信 度 就 越 高 。 


3 ”基于 主流 特征 观点 对 的 评论 可 信 度 排序 
模型 构建 


3.1 评论 可 信和 性 及 大 数据 思维 

海量 在 线 商 品评 论 对 消费 者 和 商家 都 是 宝贵 的 
言 息 资源 。 但 利用 这 些 资 源 的 前 提 是 提取 可 信 的 在 线 
商品 评论 。 何 为 评论 内 容 值得 用 户 信赖 的 评论 ? 从 认 
识 论 看 ,商品 评论 是 用 户 对 商品 的 一 种 认识 结果 或 者 
是 对 商品 的 使 用 体验 的 反应 , 评论 内 容 是 否 可 信和 受到 
两 个 方面 影响 : 用 户 对 商品 的 认识 (体验 ) 和 对 认识 ( 体 
验 ) 的 表达 。 这 种 认识 与 表达 两 者 是 否 准 确 共同 决定 了 
用 户 认识 结果 是 否 真实 反映 了 商品 的 本 质 或 者 体验 是 
真实 存在 。 商 品 的 本 质 体现 为 其 所 具有 的 功能 、 特 
性 和 技术 参数 等 信息 。 唯 有 真实 描述 了 商品 本 质 或 者 
事实 体验 的 商品 评论 , 才 值 得 用 户 信赖 。 这 种 信赖 源 
于 评论 内 容 与 商品 本 质 信 息 的 一 致 性 ,或 者 由 商品 内 
在 本 质 功 能 或 性 能 等 属性 所 决定 的 、 被 用 户 感知 的 真 
实体 验 。 总 之 , 商品 评论 内 容 与 商品 本 质 间 存在 的 因 
果 关 系 是 用 户 信赖 商品 评论 的 依据 。 

近年 来 , 大 数据 技术 正 变革 着 人 们 生活 、 工 作 和 
思维 方式 。 其 中 ， 人 们 对 竺 数据 的 思维 方式 至 少 有 三 
个 变化 : 处 理 数 据 从 样本 数据 变 成 全 部 数据 ; 全 样本 
数据 使 得 人 们 不 得 不 放弃 对 精确 性 的 追求 ， 转 变 为 接 
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受 数据 的 混杂 性 ; 借助 于 对 大 数据 处 理 ， 人们 放弃 对 
因果 关系 的 追求 ， 转 而 关注 相关 关系 已 。 迈 尔 - 舍 恩 伯 
格 等 加 明确 指出 , 大 数据 的 核心 是 预测 ,， 它 颠覆 了 人 
类 长 期 的 思维 方式 ， 从 因果 思维 转向 相关 思维 、 从 精 
确 思维 转向 容错 思维 。 即 当 拥有 海量 即时 数据 时 , 适 
当 忽略 微观 层面 上 的 精确 度 ,有限 容错 可 实现 宏观 层 
面 上 更 好 认识 事物 本 质 。 

在 人 类 认 知 过 程 中 , 传统 的 小 数据 样本 使 得 人 们 
执着 于 现象 背后 的 因果 关系 ,试图 通过 有 限 样本 数据 
把 握 事 物 的 内 在 机 理 。 通 常 小 数据 的 有 限 样本 数据 无 
法 反映 出 事物 之 间 的 普遍 性 的 相关 关系 。 而 大 数据 为 
人 们 借助 大 数据 技术 挖掘 出 事物 间 内 在 、 而 隐蔽 的 相 
关 关 系 ， 从 而 获得 更 多 对 事物 认 知 和 对 其 未 来 的 预测 
提供 了 可 能 。 相 关 关 系 使 得 可 以 大 视角 、 全 方位 认识 
事物 ， 甚 至 超越 因果 关系 ,不 必 深 究 事物 或 现象 背后 
深层 次 、 复 杂 的 原因 , 不 必用 科学 手段 证 明 事件 间 存 
在 的 必然 性 , 而 只 需 借助 大 数据 分 析 获 知 “ 是 什么 ” 即 
可 。 这 给 挖掘 新 观点 、 信 息 和 知识 , 把 握 事物 发 展 规 
律 提 供 了 新 思路 、 新 途径 。 

作为 一 种 大 数据 , 海量 在 线 商品 评论 中 富有 某 些 
内 在 的 客观 规律 。 从 细 粒 度 讲 , 评论 中 的 特征 或 者 语 
名 的 语义 是 否 与 商品 本 质 一 致 是 此 语义 可 信 的 证 据 ; 
从 大 粒度 讲 , 评论 中 的 一 段 描述 或 者 整个 评论 是 否 可 
言 ， 取决 于 此 段 或 本 评论 内 容 语 义 与 商品 的 本 质 信息 


是 否 一 致 。 基 于 因果 思维 ， 需 要 判断 评论 内 容 语义 与 
商品 本 质 信 息 是 否 一 致 。 笔 者 以 商品 特征 观点 对 "为 
语义 单位 ,改变 因果 思维 方式 考虑 问题 。 不 再 从 因果 
关系 出 发 要 求 商品 特征 观点 对 语义 符合 商品 本 质 信 
息 , 不 再 采用 科学 手段 证 明 商 品 特征 观点 对 与 商品 功 
能 、 性 能 或 者 技术 参数 之 间 存 在 因果 关系 。 而 是 从 用 
户 评论 中 含有 的 商品 特征 观点 对 的 相关 关系 出 发 , 认 
为 被 大 多 数 用 户 认可 的 特征 观点 对 是 存在 内 在 相关 联 
系 的 ,， 从 大 视角 、 全 方位 看 是 一 种 相关 的 主流 特征 观 
点 对 。 因 此 , 把 主流 特征 观点 对 视 为 在 线 商 品评 论 可 
信 的 依据 。 然 后, 统计 商品 评论 中 包含 的 可 信 特征 观 
点 对 数量 值 ， 以 此 值 作为 商品 评论 的 可 信 依 据 降序 排 
列 ,从 而 获得 可 信和 在 线 商 品评 论 的 排序 。 
3.2 ”主流 特征 观点 对 

从 本 质 上 来 说 , 一 个 观点 被 越 多 的 人 认可 ,其 可 
信赖 度 则 越 高 , 往往 该 观点 也 就 越 流行 ,自然 则 被 认 


数据 分 析 与 知识 发 现 


六 i\ /A 全 


ChinaXiv 合 作 期 刊 


_ 究 @ 文 


为 是 一 种 主流 观点 。 如 果 作 为 一 种 事实 , 它 能 够 被 越 
多 的 人 承认 ,其 可 信和 度 也 就 越 高 。 对 于 一 种 商品 , 往往 
用 户 产 生 了 大 量 、 甚 至 海量 的 商品 评论 。 基 于 上 述 思 
想 ， 如 果 商 品 的 某 个 特征 观点 被 多 个 用 户 在 其 评论 中 
提 及 认可 或 者 流行 的 , 那么 该 特征 观点 值得 信赖 的 可 
能 性 则 较 高 , 所 以 具有 较 大 语义 粒度 的 “主流 特征 观 
点 对 ”的 可 信 性 是 值得 信赖 的 。 上 述 思 想 与 目前 多 数 搜 
索引 警 的 原理 是 一 致 的 ,搜索 引擎 对 查询 页 面 的 排序 
是 基于 以 往 用 户 查 询 相同 内 容 时 点 击 页 面 的 数量 ， 即 
那些 被 点 击 次 数 越 多 的 页 面 排序 越 靠 前 1， 内 容 也 就 
越 可 信 。 

一 条 商品 评论 可 能 包含 若干 个 特征 观点 对 , 形成 
一 个 特征 观点 对 集合 。 评 论 与 评论 间 可 能 存在 相同 的 
特征 观点 对 。 当 一 个 特征 观点 对 出 现 于 多 个 特征 观点 
对 集合 中 时 ， 即 该 特征 观点 对 则 被 多 个 用 户 提 及 认可 ， 
该 特征 观点 对 就 可 能 成 为 主流 特征 观点 对 。 下 面 给 出 
相关 符号 和 定义 。 

假设 P 表 示 某 个 商品 ，F 表示 商品 P 的 特征 集 
合 ， 表示 商 品 P 的 某 个 特征 ，O 表示 商品 P 的 观点 
集合 ，o; 表示 商品 P 的 某 个 特征 的 观点 ，p(f,o,) 表 
示 商 品 P 的 某 个 特征 观点 对 。 商 品 P 的 评论 集合 为 
PR = {pni, pr,pn,…, Pni,…)} ， 其 中 ，pr; 为 第 i 个 商品 
评论 。 第 i 个 商品 评论 的 特征 观点 对 集合 
pr _fo={p(fis01),p(fy;07)…sp(fmrom)} ， 商 品 P 
评论 的 所 有 特征 观点 对 为 集合 PR_FO= 
{pn _foU pn _ foUpn_foU…pr_foU…}。 如 有 果 两 
个 特征 观点 对 集合 的 交集 为 非 空 ， 则 表明 所 对 应 的 两 
个 评论 存在 共同 的 特征 观点 对 ; 如 果子 三 3 个 特征 观 
点 对 集合 的 交集 为 非 空 ， 则 表明 所 对 应 的 XX 个 评论 存 
在 共同 的 特征 观点 对 。 随 着 评论 数量 的 增加 ， 某 个 特 
征 观点 对 得 到 更 多 评论 提 及 认同 的 可 能 性 也 就 随 之 增 
大 。 当 蕊 的 值 到 达 某 个 交 值 了 时 , 共同 出 现 的 特征 观 
点 对 即 为 主流 特征 观点 对 。 

由 于 每 个 评论 的 特征 观点 对 集合 pr _ fo 是 有 限 
的 ,这 些 评论 间 存 在 相同 、 相 似 或 者 不 同 的 特征 观点 
对 。 随 着 评论 总 量 的 增加 , 评论 的 总 体 特 征 观 点 对 趋 
于 稳定 , 即 所 有 评论 的 特征 观点 对 集合 的 并 集结 果 为 
集合 PR_FO 趋 于 稳定 。 由 此 , 主流 特征 观点 对 的 集 
合 ， 随 着 评论 数量 的 增加 趋 于 稳定 。 这 种 主流 特征 观 


点 对 集合 的 稳定 性 在 实验 部 分 得 到 验证 。 基 于 主流 特 
征 观 点 对 的 稳定 性 , 可 以 合理 选择 阔 值 7 的 值 。 

假设 包含 第 / 个 特征 观点 对 PC 记 ,o ) 的 所 有 评论 
个 数 为 count _p(f;,o)) ， 即 : 

D count_p(fj,0)) =0; 

@) count _ p(f;,0;) =count_ p(fj,0))+1, 

Vi (p(fj,0))€ pr;_fo and pr; e PR )。 

定义 1: 主流 特征 观点 对 。 设 定 一 国 值 7” ,如果 第 
j 个 特征 观点 对 p(fj,0j;) 的 count_p(fj;,0;) 宇 7， 那 
么 第 /个 特征 观点 对 p(/,,0)) 为 主流 特征 观点 对 。 

其 中 , 闵 值 值 可 以 在 测试 商品 特征 观点 对 集合 
的 稳定 性 时 ， 进行 选 择 和 调整 。 

为 了 更 为 全 面 地 度量 特征 观点 对 在 用 户 评论 中 的 
认可 度 , 给 主流 特征 观点 对 设 定 权 重 , 依据 权重 将 主 
流 特征 观点 对 划分 为 完全 主流 特征 观点 对 和 部 分 主流 
特征 观点 对 两 种 形式 , 权重 可 以 分 别 设 为 1 与 0.5。 

定义 2: 完全 主流 特征 观点 对 。 针 对 某 特征 观点 对 
出 现 的 评论 数量 (频次 ) count _ p(f,0)， 如果 大 于 等 于 
阅 值 ， 则 该 特征 观点 对 为 完全 主流 特征 观点 对 。 

定义 3: 部 分 主流 特征 观点 对 。 针 对 某 特征 观点 对 
出 现 的 评论 数量 (频次 ) count _ p(f,o)， 如 大 于 等 于 冰 
值 ”， 而 小 于 ， 则 该 特征 观点 对 为 部 分 主流 特征 观 
点 对 。 

3.3 ”基于 句法 依存 关系 的 特征 观点 对 提取 

(1) 商品 评论 数据 收集 与 清洗 

剔除 评论 中 一 些 无 关 的 信息 ,例如 广告 等 ,对 同 
一 用 户 多 次 重复 的 评论 进行 删除 。 另 外 ,对 商品 评论 
中 包括 的 一 些 网 络 用 语 、 简 称 等 人 工 将 其 转化 为 通俗 
易 懂 的 文字 。 

(2) 分 词 、 词 性 标注 以 及 句法 依存 分 析 

使 用 哈尔滨 工业 大 学 社会 计算 与 信息 检索 研究 中 
心 提供 的 语言 处 理 平台 (LTP) 对 评论 进行 分 词 、 词 性 
标注 以 及 句法 依存 分 析 , 结果 以 XML 文件 的 形式 进 
行 存储 。 

(3) 商品 特征 观点 对 提取 

在 现 有 的 商品 评论 商品 特征 和 观点 提取 的 研究 
中 , 通常 将 名 词 作为 商品 特征 , 形容 词 作为 相应 的 观 


Dhttp: /www.ltp-cloud.comy/. 
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点 词 。 通 过 对 商品 评论 的 观察 发 现 , 名 词 词组 或 者 动 
词 也 经 常 作为 商品 特征 出 现 , 同时 观点 词 不 仅仅 是 单 
一 的 形容 词 , 还 会 受 相应 的 副词 修饰 。 如 手机 评论 : 

屏幕 nn 分辩 率 n 很 d 高 a, 运行 V 流 畅 a。 

四 充电 V 速度 nn 非常 d 快 a。 

因此 ,为 了 提高 商品 特征 和 观点 词 提取 的 准确 率 ， 
将 评论 中 的 名 词组 块 (NP) 作 为 商品 特征 , 动词 组 块 作 
(VP) 为 观点 词 C1l。 利 用 哈尔滨 工业 大 学 语言 云 平台 对 
评论 进行 分 词 、 词 性 标注 和 词语 依存 关系 分 析 , 分 析 
的 结果 以 XML 文件 的 形式 存储 , 最终 利用 Dom4j 解 
析 方 法 并 结合 Xpath 技术 对 XML 文件 进行 解析 , 在 此 
基础 上 提取 出 特征 观点 对 。 

在 进行 特征 观点 对 提取 时 , 需要 基于 句法 依存 关 
系 中 建立 相应 的 提取 规则 。 通 过 对 商品 评论 的 分 词 、 
词性 标注 和 词语 之 间 的 依存 关系 分 析 ， 可 以 发 现 评论 
中 商品 特征 与 观点 词 之 间 存 在 某 些 特定 的 依存 关系 。 
如 对 上 述评 论 “屏幕 分 辨 率 很 高 ,运行 流畅 “和 “充电 
速度 非常 快 。” 进 行 分 析 , 得 到 的 分 析 结 果 如 图 1 和 图 
2 所 示 。 


HED 
Root 屏幕 分 辨 率 很 高 ， 运行 流畅 
n n d a wp a wp 


图 1 词性 标注 和 依存 和 句法 分 析 


HED 


A 


Root ”充电 速度 非常 人 快 


V n d a wp 
图 2 词性 标注 和 依存 句法 分 析 


上 述 商 品 特征 与 观点 词 之 间 的 依存 关系 为 
SBV( 主 谓 ), 基于 此 , 构建 如 下 的 规则 : 

规则 1 在 商品 评论 中 一 个 单 句 满足 SBV( 主 谓 ) 依 
存 关 系 , 那么 句 中 对 应 的 名 词 为 商品 特征 ， 对 应 的 形 
容 词 为 观点 词 。 

根据 规则 1 对 上 述 两 条 评论 提取 特征 观点 对 , 提 
取 的 结果 为 : < 分 辨 率 ,， 高 >、< 速 度 , 快 >。 显 然 提 取出 
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的 特征 观点 对 不 够 具体 ， 如 “屏幕 分 辨 率 "是 一 个 整体 ， 
却 被 分 成 了 “屏幕 "和 “分 辩 率 ”。 男 外 ,对 于 其 中 观点 词 
也 不 能 提取 出 相应 修饰 副词 。 因 此 , 为 使 提取 出 的 特 
征 观点 对 更 准确 , 对 规则 1 进行 改进 , 将 由 两 个 名 词 


品 的 评论 可 信 度 集合 为 C_ PR = {cpr,cpn,cpny,…,Cph,…}， 
Cpri 为 第 i 个 商品 评论 的 可 信和 度 。 第 i 个 商品 评论 的 特征 观 
点 对 集合 pr;_f0={p(fi,01),p(fy,02),*……, Pf om)} 9 


Begin 
设 定 评论 的 初始 可 信 度 值 为 0; 


或 一 个 动词 一 个 名 词 构成 的 词组 作为 一 个 名 词组 块 ， 
如 “屏幕 分 辩 率 "“ 充 电 速 度 ” 将 由 副词 和 形容 词 构成 a 
的 词组 作为 一 个 动词 组 块 。 改 进 后 的 规则 如 下 : 

规则 2 在 商品 评论 中 一 个 单 句 满足 SBV( 主 谓 ) 依 { 


If p(fj,0j))e pri_fo and p(fj,0)) 是 完全 
主流 特征 观点 对 


存 关系 , 判断 名 词 或 动词 之 前 是 否 有 与 其 构成 ATT( 定 

中 ) 依 存 关系 的 词 ,如 有 将 二 者 作为 一 个 名 词组 块 提取 

为 商品 特征 ,对 于 相 容 词 判断 之 前 是 否 有 与 其 构成 

ADV( 状 中 ) 依 存 关系 ,如 果 有 将 前 面 的 词 与 形容 词 作 
本 。 ”为 一 个 动词 组 块 , 提取 为 观点 词 。 


then cpr; = cpr; + Ww ; 
else If p(fj,0;)e pt; _ fo and p(fj,0;) 是 部 分 
主流 特征 观点 对 


then cpr; = cpr; + w, ; 


= 根据 规则 2 对 上 述评 论 进行 特征 观点 对 提取 , 最 
CD 络 提取 结果 为 : < 屏幕 分 关 洒 ,很 高 > < 运行, 流畅 >、 3 
= < 充电 速度 , 非常 快 >。 i=itl; 
©O 高 品评 论 本 位 认 的 1 } 
一 。 3.4 在 线 商品 评论 可 信 度 的 计算 排序 > 
GN 本 文 在 线 商品 评论 可 信 度 模型 构建 主要 分 为 以 下 ff 商科 闪闪 的 可 入 在 排 有 
步骤: End 


(1) 依据 3.3 节 , 对 所 有 用 户 商 品评 论 进行 基于 句 
法 依存 关系 的 特征 观点 对 的 提取 。 

(2) 根据 词语 间 相 似 度 对 特征 观点 对 聚 类 并 统计 
每 个 特征 观点 对 出 现 于 评论 的 评论 数量 ( 频 
数 )count _p(f,0)。 

@@ 对 相似 或 者 同 义 的 特征 观点 对 聚 类 ， 由 于 特征 观点 
对 中 包含 了 商品 特征 和 观点 词 两 项 ， 因 此 在 聚 类 时 进行 两 
个 特征 观点 对 相似 度 计 算 时 需要 注意 。 具 体 计算 如 下 : 

设 pi(fi,01) 、ps(p,0;) 分 别 为 两 个 特征 观点 对 ， 了 为 
商品 特征 词 ，o 为 观点 词 , 记 sim(pi,p;) 为 两 个 特征 观点 对 
的 相似 度 ， 如 公式 (1) 所 示 。 

sim(pi, p») = min{sim( fi, f»),sim(o1,0,)} (1) 

根据 特征 观点 对 相似 度 计算 的 结果 设 定 一 个 合理 的 阔 
值 (不 妨 取 值 0.8)， 以 此 来 对 特征 观点 对 进行 聚 类 。 

@) 统 计 从 商品 评论 中 提取 出 的 特征 观点 对 的 数量 ， 以 
count _p(f,0) 表示 每 个 特征 观点 对 出 现 于 评论 中 的 评论 数 
量 ( 频 次 )。 

依据 实验 选择 确定 阅 值 四 和 nm,， 取 阅 值 =18 和 
1 =11, 将 count_p(f,0) 宇 1 的 特征 观点 对 设 为 完全 主流 
特征 观点 对 ,权重 wi 为 1， 而 count_p(f,0) 宇 7n, and 
count _p(f,0) < 的 为 部 分 主流 特征 观点 对 ,权重 Ww, 为 0.5。 

@) 根 据 每 条 评论 中 包含 的 主流 特征 观点 对 的 数量 计算 
其 用 户 认可 度 ， 对 评论 的 用 户 认可 度 进行 可 信 度 排序 。 设 商 
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4 实验 与 评价 


4.1 主流 特征 观点 对 提取 及 其 稳定 性 验证 

目前 尚 无 公开 、 可 用 的 商品 评论 可 信和 性 测试 数据 
集 ， 只 能 通过 抓 取 电 商 平 台 的 商品 销售 数据 进行 测 
试 。 国 内 消费 者 选 购 电子 产品 的 主要 平台 为 淘宝 、 天 
猫 和 京东 三 大 平台 。 事 实 上 , 本 文 考 虑 的 魅 蓝 Note 5 
在 其 他 电 商 平台 的 手机 评论 较 少 , 所 以 选用 上 述 三 个 
平台 的 魅 蓝 Note 5 手机 评论 作为 实验 数据 。 利 用 八 不 
鱼 软 件 分 别 从 淘宝 网 、 天 猫 商城 和 京东 商城 上 各 抓 取 
魅 蓝 Note 5 手机 评论 若干 条 ,经 过 预 处 理 , 吻 除 部 分 
无 效 的 商品 评论 , 各 留 下 有 效 评论 1 200 条 。 使 用 哈 尔 
滨 工 业 大 学 语言 处 理 平 台 (LTP) 对 评论 进行 分 词 、 词 性 
标注 和 句法 依存 分 析 , 分 析 结 果 以 XML 文件 的 形式 
进行 存储 。 通 过 对 XML 文件 的 解析 ,获得 特征 观点 对 
并 对 其 数量 进行 统计 与 分 析 。 

本 文 考虑 验证 主流 特征 观点 对 的 稳定 性 。 对 于 一 
个 商品 来 说 , 只 有 其 主流 特征 观点 对 是 稳定 的 , 判断 
其 用 户 的 观点 是 可 信 的 才 值 得 信赖 、 具 有 实际 价值 。 
针对 从 三 个 平台 抓 取 、 经 过 预 处 理 分 别 获得 的 1 200 
条 有 效 商 品评 论 , 将 所 有 评论 混合 (混合 的 目的 是 避免 


平台 带 来 的 差异 ) 在 一 起 并 随机 分 为 12 组 : 第 1 组 为 
300 条 评论 ; 第 2 组 为 600 条 , 后 面 每 组 依次 增加 300， 
直至 第 12 组 为 3 600 条 评论 。 表 1 为 不 同 阔 值 下 提取 
出 的 主流 特征 观点 对 数目 , 方差 8(8-12) 方差 9(9-12)、 
方差 10(10-12) 分 别 为 取 第 8、9、10 组 到 第 12 组 的 方 
差 , 即 评论 规模 基数 为 2 400、2 700、3 000 条 时 , 每 


1 不 同 国 值 下 提取 出 
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增加 300 条 后 直至 3 600 条 评论 的 相应 规模 评论 集合 
所 获取 主流 特征 观点 对 数目 的 方差 情况 , 例如 ， 对方 
差 9(9-12)， 闪 值 为 6 时 ,其 评论 规模 基数 为 2 700， 然 
后 , 规模 分 别 为 3 000, 3 300, 3 600 时 所 获取 的 相应 主 
流 特征 观 点 对 的 数目 为 63，68, 70, 74, 计算 这 4 个 数 
据 的 方差 为 20.92。 


的 主流 特征 观点 对 数 


类 别 第 1 组 | 第 2 组 第 3 组 第 4 组 | 第 5 组 第 6 组 第 7 组 第 8 组 第 9 组 第 M10 组 第 1 组 第 M2 组 | 方差 8 方差 9 方差 0 


浆 值 (300) (600) (900) 


(1200) (1500) (1800) (2100) (2400) (2700) (3000) (3300) (3600) 


6 10 20 33 39 42 49 51 
7 6 19 28 32 36 44 46 
8 6 16 27 31 32 39 41 
9 5 14 25 29 32 36 39 
10 5 12 22 26 32 33 38 
il 5 il 20 24 28 31 35 
12 5 11 19 22 27 31 33 
13 4 10 17 22 24 31 33 
14 4 9 15 17 21 31 31 
15 4 9 Ts 15 21 27 31 
16 4 8 15 15 20 和 25 29 
17 3 7 15 15 20 24 27 
18 3 7 14 14 19 22 PE 
19 2 7 13 14 18 21 25 
20 2 6 13 14 16 19 21 
21 1 6 13 14 15 18 20 
22 1 6 10 13 14 18 19 
23 l 6 10 12 14 18 18 
24 1 6 9 11 14 16 18 
25 1 6 9 11 12 16 18 


(8-12) (9-12) (10-12) 
53 63 68 70 74 65.30 20.92 9.33 
47 52 58 64 66 63.80 40.00 17.33 
44 48 52 60 64 68.80 53.33 37.33 
41 45 47 50 57 36.00 27.58 26.33 
39 43 43 44 52 22.70 19.00 24.33 
37 42 43 43 46 10.70 3.00 3.00 
34 38 41 42 45 17.50 8.33 4.33 
33 36 37 37 42 10.50 7.33 8.33 
32 34 35 37 39 7.30 4.92 4.00 
32 32 33 33 37 4.30 4.92 和 33 
31 32 33 33 36 3.50 3.00 3.00 
31 32 32 33 3 2.30 2.00 2.33 
27 3) 32 32 34 6.70 L388 ,33 
25 29 32 32 34 12.30 4.25 1.33 
23 29 30 30 31 10.30 0.67 0.33 
22 28 29 30 31 12.50 1.67 1.00 
21 25 28 29 30 13.30 4.67 1.00 
20 20 24 26 30 18.00 3 3 
20 20 22 24 29 14.00 14.92 13.00 
18 20 20 21 28 14.80 14.92 19.00 


通过 表 1 可 知 , 设 定 不 同 的 阐 值 ,针对 不 同 数量 
的 评论 所 提取 出 的 主流 特征 观点 对 数目 不 同 , 并 且 
表 中 右 侧 最 后 三 列 方差 的 变化 也 较 大 ,表明 主流 特 
征 观点 变化 较 大 。 当 阅 值 取 大 于 10 以 后 , 方差 变化 
趋 于 平缓 ， 直 至 阔 值 为 25, 波动 都 比较 小 。 例 如 ,对 
于 第 8 组 (评论 规模 基数 为 2400)， 当 阅 值 为 11 后 , 其 


点 对 的 评论 数量 , 该 数量 达到 一 定 值 时 , 不 可 能 存在 
相应 数量 的 评论 都 含有 该 特征 观点 对 。 例 如 ， 从 阔 值 
为 23 开始 , 右 侧 的 方差 丝 出 现 增 大 的 情况 ; 再 如 ,对 
于 第 1 组 ， 随 着 阔 值 大 于 21 后 , 特征 观点 对 的 个 数 会 
逐渐 达到 1。 

为 了 更 为 全 面 度量 用 户 对 特征 观点 对 的 认可 程 


主流 特征 观点 对 的 个 数 为 37; 对 于 第 9 组 (评论 规模 
为 2 700), 主流 特征 观点 对 个 数 相应 增加 并 趋 于 稳定 
为 和 2， 当 阅 值 为 20 后 , 其 主流 特征 观点 对 个 数 趋 于 
稳定 为 30。 这 种 稳定 性 表明 了 该 商品 用 户 评论 的 主 
流 特征 观点 在 一 定 阔 值 范围 内 保持 相对 稳定 ,是 值 
得 信赖 的 具有 实际 价值 。 当 然 ， 随 着 阔 值 越 大 ， 如 
果 要 获取 主流 特征 观点 对 的 稳定 性 ， 其 评论 规模 的 
基数 也 应 该 增 大 ， 因 为 闷 值 规定 了 蕴含 有 某 特 征 观 


度 , 设 定 完全 和 部 分 主流 特征 观点 对 两 种 形式 ,赋予 
不 同 的 认可 度 权重 。 从 表 1 方差 看 ,选取 阔 值 九 =18 
和 ww, =11, 分 别 设 定 权 重 w 为 1，W 为 0.5。 在 选 定 
阔 值 六 =18 和 7 思 =11 后 ,对 淘宝 网 上 的 1 200 条 评论 
(未 含 天 猫 、 京 东平 台 的 评论 ,因为 淘宝 平台 提供 了 
推荐 排序 ， 可 以 与 本 模型 的 排序 结果 进行 验证 对 比 ) 
提取 出 的 13 组 完全 主流 特征 观点 对 和 7 组 部 分 主流 
特征 观点 对 ， 如 表 2 所 示 。 
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表 2 完全 和 部 分 主流 特征 观点 对 但 是 这 些 方法 从 语义 角度 研究 评论 可 信和 性 的 较 少 , 测 
序号 ”特征 观点 对 ”数量 ”序号 ”特征 观点 对 ”数量 试用 数据 集 也 是 通过 抓 取 电 商 平台 获得 ， 而 本 文 从 完 
118 ， 20 全 不 同 的 角度 研究 评论 可 信 性 , 直接 可 比 性 较 差 , 但 
2 观 漂亮 76 12 ”价格 便宜 16 下 ya 
3 网 Ty jg 可 以 间接 比较 。 根 据 上 述 提取 出 的 主流 特征 观点 对 以 
5 ”手机 不 错 41 15 ”系统 流畅 14 序 、 本 模型 和 文献 [14] 方 法 排序 前 3 名 的 用 户 评 论 进 
0 0 行 分 析 比 较 , 具体 如 表 3- 表 5 所 示 。 
所 电池 耐用 30 17 流 | 14 a 
8 ”音质 差 5 18 ”价格 公道 请 文献 [14] 方 法 仅仅 考虑 商品 特征 与 商品 评论 的 关 
9 ”质量 好 24 19 ”屏幕 不 灵 10 联 度 ， 比 商品 特征 观点 对 较 小 的 语义 关联 会 导致 与 商 
10 ”拍照 差 23 20 ”信号 差 10 品 本 质 信息 不 一 致 的 情况 发 生 。 因此 , 文献 [14] 的 排序 
( 注 : 表 中 加 黑 的 为 部 分 主流 特征 观点 对 ) 结果 与 本 文 方法 的 排序 结果 存在 差异 。 
4.2 ”评论 可 信和 度 排序 实验 结果 分 析 对 本 文 模 型 排序 方法 与 淘宝 推荐 模型 、 文 献 [14] 


虽然 存在 少量 对 在 线 商 品评 论 可 信 研 究 的 方法 ， ”中 的 排序 评论 从 三 个 方面 进行 对 比分 析 。 


表 3 评论 可 信 度 排序 结果 I 


淘宝 /本 模型 评论 者 cpr 评论 内 容 评论 时 间 投票 数 


妇 到 了 ,确认 是 正品 。 之 前 看 些 差 评 不 理解 , 没 你 们 说 的 那么 差 。 之 所 以 
买 魅族 是 因为 喜欢 , 我 们 一 家 人 都 是 魅族 手机 。 这 台 手 机 挺 好 看 的 ,冰川 
微 *ssi 直 的 超级 喜欢 。 看 看 我 的 魅 蓝 note2, 屏幕 都 要 脱落 了 , 我 觉得 还 是 好 2017 年 02 月 ”有 用 
L336 OO |! ， 虽然 没有 3g 运行 。 所 以 这 次 买 魅 蓝 note5。 魅 族 没 有 那么 差 , 而 你 们 “25 日 22: 53 (0) 
sw 那 就 去 买 符合 你 们 要 求 的 啊 。 谁 还 逼 你 买 了 ,而 且 买 的 人 没 花 
尔 的 钱 。 物流 全 五 分 , 前 天 下 午 下 单 , 今天 中 午 收 到 了 。 客服 全 五 分 有 
问 必 答 ,态度 良好 。ps: 冰川 蓝 太 好 看 了 。 


0 note4x 和 魅 蓝 note5 之 间 犹 殉 ， 最 终 还 是 选择 魅族 ， 外 观 工 艺 


27407 2Z***5( 匿 名 ) | 是 魅族 的 强项 ,前 置 指纹 的 mback 比 起 后 和 来 说 方便 很 多 1 p10 没有 2017 年 02 月 ”有 用 
全 全 ss 做 工 优良 ， 完 完全 全 不 像 千 元 机 ， 当 然 不 足 还 是 有 的 , 比如 26 日 15:55 (0) 
mback 手感 ， 以 及 外 放 不 如 mx61 很 满意 ! 
之 前 用 的 Note2 摔 坏 了 ,用 换 机 助手 很 方便 就 完成 了 数据 迁移 。 指 纹 识 别 
很 灵敏 ， 快 充 也 是 一 大 亮点 。 唯 一 不 大 满足 的 就 是 摄像 头 成 像 效 果 比 较 差 ， 
7 曾 陈 ***9 跟 Note2 相 比 ， 完 全 没 进步 。 总 的 来 说 , 一 千 多 一 丢 丢 能 买 到 这 样 的 机 子 2017 年 02 月 ”有 用 
过 ” 已 经 很 满足 啦 ， 稍 微 好 一 点 的 衣服 都 要 上 和 于 了。 推荐 购买 ， 绝 不 后 悔 。 店 27 日 12: 23 (0) 


家 还 有 个 小 不 足 ， 就 是 给 我 发 的 是 移动 版 的 ( 充 子 上 印 有 移动 4G 标志 ), 还 
好 刷机 后 跟 通用 版 没 差别 。 


表 4 评论 可 信 度 排序 结果 工 


淘宝 /本 模型 ” 评论 者 cpr 评论 内 容 评论 时 间 ”投票 数 
非常 好 的 买 家 , 手机 是 未 拆 封 正品 ,价格 实惠 ， 服 务 周 到 ,发 货 快 , 手感 非 


73711 。 悠 ***5( 匿 名 ) 5 常 好 ,用 了 几 关 ， 很 流畅 长 续航 ， 充 电 确实 比较 快 卖家 的 服务 态度 也 非 

1392。。 Ne。 4 不全, 屏 名 大 清太 .反应 过 度 也 介 忆 最 二 要 这 么 大 屏 的 手机 价格 很 人 2017 征 02 月。 有 有 

SHY 惠 的 ， ee 27 日 13:12 (0) 
买 了 两 台 ,一 台 备用 机 ， 一 台 送 别人 。 做 工 手感 等 等 是 最 好 的 , 颜 值 高 。 但 

68675。 jr*rn( 攻 名 ) 。。 系统 简单 得 也 有 些 简陋 。 外 在 够 了 ， 内 在 却 令 人 失望 。 摄 像 是 最 差 的 , 其 他 2017 年 01 月 “有 居 

二 学 零 部 件 如 震动 等 得 于 成 本 也 明显 感觉 不 怎样 , 声音 还 可 以 。 总 的 来 说 也 值得 25 日 14:38 (0) 


购买 ， 当 然 只 推荐 备用 ,毕竟 颜 值 够 就 好 ， 其 他 的 用 主力 机 才 是 正道 。 
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表 5 评论 可 信和 度 排序 结果 III 
文献 [14]/ 本 模型 评论 者 ”cpr 评论 内 容 评论 时 间 ”投票 数 
全 这 价位 、 这 做 工 、 这 发 货 速度 ,简直 无 敌 ! 手机 很 好 用 , 颜 值 高 ， 充 电 速 度 ?017 年 02 月 
1/7 及 旦 ”3.5 快 , 电池 够 大 ,完全 掩盖 了 外 放 音 质 和 拍照 的 弱点 , 魅 蓝 Note5 这 个 价位 最 D3 08 有 用 (0) 
好 的 手机 ,你 值得 拥有 ! 
义 前 有 一 部 MX4 ， 现 在 用 魅 蓝 NOTE2 电信 版 一 年 半 , 最 近 觉 得 越 来 越 慢 ， 
经 常 要 清空 内 存 , 决定 换 机 ,考虑 过 红 米 NOTE4, CPU 肯定 不 错 ， 可 惜 就 是 
ee 不 喜欢 后 置 的 指纹 解锁 按键 ,放弃 了 。 最 终 选 择 了 4G 64G 版 本 ,不想 再 删 这 ?017 年 02 月 
2/14 过 如 3 删 那 了 .用 机 2 天 , 说 说 优点 , 快 充 不 错 , 电池 容量 大 , 一 般 用 两 天 应 该 不 成 09 日 11:38 有 用 (0) 
问题 ， 全 金属 手感 也 不 错 。 只 是 觉得 屏幕 和 相机 都 不 如 MX4， 声音 不 如 - 
NOTE2， 典 型 的 学 生机 。 但 4G 64G 的 配置 价格 不 过 1300, 已 经 是 相当 难得 
了 , 适合 工薪 阶层 。 好 评 ! 
对 ss 她 用 了 几 天 才 来 评论 ， 这 个 手机 虽然 涨 价 了 但 性 价 比 仍然 很 好 ， 颜 值 做 工 都 比 ?017 年 02 月 
3/11 号 红 米 好 ,前 置 指纹 和 系统 也 比 小 米 好 ,， 快 充 给 力 , 缺点 是 拍照 弱 , Cpu 赶不上 19 日 09:12 有 (0) 
红 米 ， 玩 游戏 会 内 退 ， 总 之 我 觉得 这 机 子 比 红 米 强 一 点 。 .| 


(1) 评论 相关 性 评价 

评论 的 相关 性 评价 主要 是 指 商品 评论 内 容 是 否 涉 
及 商品 的 各 个 方面 ,主要 包括 商品 的 功能 、 质 量 、 性 
价 比 、 外 观 、 服 务 和 物流 等 扬 ]。 

(2) 评论 体验 性 评价 

体验 性 评价 主要 考虑 评论 者 是 否 有 使 用 过 该 商 
或 服务 以 及 是 否 有 过 网 购 的 经 验 。 


Le 
口 口 


(3) 评论 有 用 性 评价 
评论 有 用 性 是 指 商 品评 论 内 容 是 否 具有 为 潜在 消 
费 者 提供 有 帮助 的 购买 商品 的 决策 信息 。 

为 了 进一步 验证 本 模型 的 有 效 性 , 综合 表 3- 表 5$， 
设计 调查 问卷 分 析 本 文 模型 的 认可 度 。 共 发 放 问 卷 
300 份 , 收回 175 份 。 模 型 认可 度 对 比如 表 6 所 示 , 其 
中 “小 "表示 认可 度 超过 60%,“x” 表 示 认 可 度 低 于 60%。 


表 6 模型 认可 度 对 比 


评论 相关 性 评价 商品 体验 性 评价 评论 有 用 性 评价 
对 比 项 目 排序 比 评论 担 供 
功能 质量” 性价比” 外观 ”服务 ”物流 ”使 用 后 评价 ”网 购 经 验 0 
1/336 x y x x y 可 
淘宝 /本 模型 2/407 x y y x x x x x y 
3/362 x y x x x y y gy 
1/737 y Y y x y + y 村 y 
本 模型 /淘宝 。 2/1144 y y y x y y 由 | | | 
3/638 y y y y x x 对 y a 
1/7 x y y y x y y y 
文献 [14]/ 本 模型 ”2/14 y x y x x x a y -| 
3/11 y y y y x x y 入 y 


从 表 6 可 以 看 出 , 本 模型 的 认可 度 对 比 淘宝 推荐 
排序 较 好 , 其 中 82.87% 的 消费 者 认为 经 过 本 模型 排序 
过 的 评论 能 够 提供 购买 决策 的 相关 信息 ; 淘宝 推荐 排 
序 更 多 考虑 的 是 评论 时 间 以 及 评论 者 信誉 等 级 等 因 
素 , 较 少 考虑 评论 内 容 ,而 本 文 模型 排序 则 更 多 考虑 
的 是 那些 包含 被 多 数 消费 者 提 及 并 认可 的 特征 观点 对 


wr bi 


可 信 ， 因 为 评论 内 容 能 够 提供 更 多 与 商品 相关 的 信 
息 。 原因 在 于 , 表 2 中 的 13 组 完全 主流 特征 观点 对 和 
7 组 部 分 主流 特征 观点 对 , 覆盖 了 该 商品 的 功能 、 质 
量 、 人 性价比、 外观、 服务 和 物流 等 方面 ,其 排序 表达 
了 大 部 分 用 户 的 观点 , 为 主流 用 户 观 点 , 体现 了 本 文 
方法 的 优势 。 所 以 , 本 文 方法 较 淘 宝 推荐 排序 更 加 真 


等 评论 内 容 要 素 。 事 实 上 ,消费 者 需要 评论 内 容 本 身 


实 、 可 信 。 
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对 比 本 模型 与 文献 [1 和 可 看 出 : 

(1) 在 评论 相关 性 方面 ,两 者 的 评论 内 容 均 涉及 
产品 的 功能 、 质量 、 性 价 比 和 外 观 等 方面 , 但 文献 [14] 
很 少 涉及 产品 的 服务 与 物流 等 , 原因 是 , 文献 [14] 考 
虑 用 户 评论 内 容 与 产品 特征 的 关联 度 , 计算 关联 所 用 
产品 特征 源 于 商品 广告 ， 鲜 少 提 及 产品 服务 与 物流 等 
内 容 。 因 此, 本 文 模型 排序 的 用 户 评论 较 文献 [14] 涉 及 
到 的 产品 特征 范围 更 广 、 更 全 。 

(2) 在 评论 有 用 性 方面 , 文献 [14] 和 本 文 模型 相 
比 , 前 者 有 75.32% 的 消费 者 认可 度 ， 而 后 者 有 82.87% 
的 消费 者 认可 度 。 

(3) 从 表 5 中 文献 [14] 排 序 位 列 前 3 的 评论 可 看 出 ， 
评论 中 提 及 的 产品 特征 数量 虽然 较 多 , 但 是 评论 中 很 
多 的 产品 特征 只 是 被 提 及 , 并 没有 包含 用 户 对 其 所 持 
有 的 观点 ， 这些 未 含 用 户 观 点 的 产品 特征 其 意义 并 不 
大 , 而 本 文 主流 特征 观点 对 因 其 含有 用 户 观 点 语义 使 
得 其 对 消费 者 购买 决策 更 有 意义 。 


S 结 语 


在 电子 商务 购物 网 站 上 ,消费 者 很 容易 “迷失 ”在 
海量 的 商品 评论 中 。 消 费 者 为 了 获取 一 些 有 助 于 购买 
决策 的 信息 , 往往 需要 花费 大 量 的 时 间 和 精力 。 从 在 
线 商 品评 论 中 包含 的 主流 特征 观点 对 的 数量 出 发 ， 提 
出 一 种 在 线 商 品评 论 可 信 度 的 排序 方法 ， 即 包含 越 多 
的 主流 特征 观点 对 ,， 则 评论 越 可 信 。 实 验 表明 , 经 过 本 
方法 排序 后 的 评论 更 加 真实 可 信 , 能 够 为 潜在 消费 者 
提供 一 定 的 购买 决策 信息 。 本 文 仅 根 据 在 线 商品 评论 
中 包含 的 主流 特征 观点 对 的 数量 判断 其 可 信 度 的 大 
小 , 因此 本 文 存在 一 定 的 局 限 性 ,表现 在 特征 观点 对 
提取 的 准确 性 有 竺 提高、 特征 观点 对 的 覆盖 度 需要 扩 
大 , 包括 特征 属性 值 等 。 越 来 越 多 的 商品 评论 中 包含 了 
一 些 更 加 真实 可 信和 的 图 片 信 息 ,这些 信 息 为 评判 在 线 
评论 可 信 提 供 了 更 多 的 视角 , 将 是 进一步 研究 的 工作 。 
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Ranking Credibility of Online Product Reviews Based on 
Feature-Opinion Pair 


Wang Zhongqun Wu Dongsheng Jiang Sheng Huang Subin 
(School of Management and Engineering, Anhui Polytechnic University, Wuhu 241000, China) 


Abstract: [Objective] This paper tries to choose credible comments from a large number of online product reviews, 
aiming to help consumers make purchasing decisions. [Methods] First，we proposed a concept of mainstream 
feature-opinion pair with the help of big data. Then, we established the credibility ranking model based on the 
recognition level of feature-opinion pair from different users’ comments. [Results] We found that the mainstream 
feature-opinions of online product reviews were relatively stable among the users of Taobao, TMall and Jingdong. 
Compared with existing models, the reviews sorted by our method covered more product features, and their helpfulness 
was increased by 7.5%. [Limitations] We did not consider the specific semantic situation of the comments while 
ranking their credibility. [Conclusions] The more mainstream feature-opinion pairs each comment contains, the more 
credible it is. 


Keywords: Online Product Reviews Feature-Opinion Pair Credibility 


智能 手机 应 用 可 以 减少 抑郁 症 


一 项 新 研究 证 实 , 智能 手机 应 用 程序 是 抑郁 症 的 有 效 治疗 方案 , 为 世界 各 地 数 百 万 诊断 出 患 有 抑郁 症 的 人 提供 安全 方便 
的 干预 措施 。 

抑郁 症 是 最 普遍 的 精神 障碍 ,也 是 导致 残疾 的 主要 原因 ， 为 满足 治疗 需求 , 全 球 各 地 的 心理 健康 服务 机 构 付 出 了 诸多 的 
努力 。 为 应 对 这 一 不 断 严峻 的 挑战 , 澳大利亚 国家 补充 医学 研究 所 (National Institute of Complementary Medicine, NICM) 、 哈 
佛 医学 院 、 曼 彻 斯 特大 学 ,以 及 澳大利亚 黑 狗 研究 所 的 研究 人 员 研 究 了 基于 智能 手机 治疗 抑郁 症 的 疗效 。 研究 人 员 系 统 地 回 
顾 了 18 项 随机 对 照 试验 ， 共 审查 了 22 项 智能 手机 精神 卫生 干预 措施 。 

该 研究 受 试 者 是 18 至 59 岁 之 间 的 3 400 多 名 男性 和 女性 , 包括 重度 抑郁 症 、 轻 度 至 中 度 抑郁 症 、 双 相 情 感 障碍 、 焦 虑 
和 失眠 等 精神 健康 症状 和 状况 。 该 研究 发 表 在 World Psychiatry 杂志 ,发 现 : 整体 智能 手机 应 用 程序 大 大 降低 了 人 们 的 抑郁 症 
状 , 这 表明 这 些 新 的 数字 疗法 可 用 于 管理 病情 。 

文章 主要 作者 NICM 博士 后 研究 员 Joseph Firth 认为 这 是 一 个 重要 的 发 现 , 为 可 能 无 法 获得 治疗 机 会 的 患者 提供 了 可 及 
的 、 可 负担 得 起 的 护理 新 机 会 。“ 发 达 国家 的 大 多 数 人 都 拥有 智能 手机 , 包括 日 益 受 到 抑郁 症 影响 的 年 轻 人 ,”Firth 说 :“ 结 合 
这 一 领域 的 迅速 技术 进步 , 这 些 设 备 可 能 最 终 能 够 为 抑郁 症 提供 即时 、 可 及 、 高 效 的 治疗 方法 ， 从 而 在 全 球 范 围 内 减轻 这 种 
疾病 的 社会 和 经 济 负担 。” 

文章 共同 作者 NICM 副 主任 Jerome Sarris 教授 说 :“ 数 据 显示 , 智能 手机 可 以 帮助 人 们 监控 ,理解 和 管理 自己 的 心理 健康 ， 
将 应 用 程序 作为 "综合 医学 方法 进行 抑郁 症 治疗 的 一 部 分 已 经 被 证 明 对 于 改善 这 些 患 者 的 情绪 和 解决 症状 是 特别 有 用 的 。” 

关于 “哪个 应 用 程序 最 好 ?” 和 “对 谁 最 有 效 ?” 这 两 个 问题 ， 研 究 结果 表明 , 迄今 为 止 这 些 干预 措施 最 适用 于 轻 度 至 中 度 抑 
郁 症 患 者 ,因为 针对 重症 抑郁 证 的 效果 尚未 得 到 广泛 研究 。 

尽管 早期 取得 了 一 定 的 成 果 , 但 目前 还 没有 证 据 表明 单独 使 用 应 用 程序 可 以 胜 过 标准 的 心理 疗法 ,或 是 能 够 减少 对 抗 抑 
郁 药物 的 需求 。 

本 文 合 著者 黑 狗 人 研究 所 博士 生 Jennifer Nicholas 认为 ， 目 前 已 经 知道 应 用 程序 可 以 有 效 地 管理 抑郁 症 , 今后 的 研究 应 该 
进一步 调查 是 哪些 特征 产生 了 这 些 有 益 的 效果 。 

(编译 自 : https://www.sciencedaily.com/releases/2017/09/170922090949.htm) 
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